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摘要 2013 年 5 月 ， 以 《科研 评价 的 旧金山 宣言 》(DORA) 发 布 为 标志 ， 拉 开 了 国际 科技 评价 改革 的 序幕 。 
10 年 来 ， 国 际 科技 评价 改革 经 过 大 量 理论 准备 和 倡议 ， 正 在 走向 实践 ，40 多 个 国家 的 350 多 家 机 构 签 署 《 改 
革 科 研 评价 的 协定 》 并 进行 改革 试点 ， 效 果 初 显 。 文 章 从 改革 目标 、 举 措 及 案例 3 个 方面 ， 对 国际 科技 评价 


10 年 改革 进行 了 系统 总 结 和 分 析 ， 并 从 与 我 国 科技 评价 改革 比较 的 角度 ， 
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2013 年 5 月 , 《科研 评价 的 旧金山 宣言 》( 以 下 简 
称 DORA 或 《旧金山 宣言 》) ERZA, Sf 
逐渐 兴起 的 “以 刊 评 文 ， 以 文 评 人 ”问题 。《 旧 金山 
宣言 》 得 到 国际 科学 共同 体 广泛 认同 与 反响 ; 以 此 为 
旗帜 ,许多 国 际 学 术 组 织 、 学 术 年 会 、 高 校 与 研究 机 
构 开 始 讨论 科技 评价 改革 。 同 时 ， 成 立 了 DORA 科技 
评价 联盟 、 科 技 管理 国际 联盟 (INORMS) 科技 评价 
工作 组 等 新 的 国际 组 织 致力 于 推动 科技 评价 改革 。10 
年 来 ， 国 际 科 技 评价 改革 不 断 深 入 ， 逐 步 从 理念 层面 


* 通 信 作 者 


得 出 研究 结论 和 局 示 。 


的 提倡 和 讨论 落实 到 众多 科研 机 构 的 实践 探索 之 中 ， 
效果 初 显 。 

笔者 曾 于 2022 年 发 表 过 《科技 评价 改革 十 年 评 
述 》 一 文 扬 ， 对 我 国 科技 评价 10 年 改革 进行 过 总 结 。 
认为 ， 以 “三 评 ” 改 革 和 破 “ 四 唯 ”为 代表 的 我 国 科 
技 评 价 改革 正 处 在 关键 时 刻 。 虽 然 目 前 在 清理 “四 
唯 ” 上 已 取得 初步 效果 ， 以 论文 等 指标 进行 简单 量化 
评价 的 现象 明显 好 转 。 但 是 ,“ 立 新 标 ” 还 在 半路 上 ， 
特别 是 科技 评价 改革 所 要 引导 的 对 卓越 的 价值 追求 还 
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远 未 形成 。 对 此 ， 如 何 谋划 下 一 步 科技 评价 改革 的 目 


国人 


“以 刊 评 文 ”的 逐步 兴起 一 一 “发 表 在 哪儿 比 发 表 什 


标 和 举措 是 迫切 需要 回答 的 重要 课题 。 笔 者 作为 国际 
科技 评价 组 织 的 任职 者 "和 经 历 者 ， 通 过 对 国际 科技 
评价 改革 10 年 进行 系统 的 梳理 、 分 析 和 上 比较， 得 出 相 
应 结论 和 启示 ， 以 期 起 到 他 山 之 石 的 效果 。 

为 避免 引起 歧义 ， 对 文中 2 个 概念 进行 说 明 : 
CD 本 文中 提 及 的 国内 、 国 际 的 科技 评价 均 指 针对 高 
等 学 校 、 科 研 机 构 〈 含 科研 资助 机 构 ) 开展 的 以 基 
础 研究 为 主 的 科研 评价 ， 包 括 论 文 、 人 才 、 项 目 、 
机 构 等 的 评审 评价 ， 尽 管 英文 一 般 被 称 为 “research 
assessment" 或 “research evaluation”， 但 是 ， 为 了 与 
国内 语 境 保持 一 致 ， 本 文 沿用 “科技 评价 ”而 不 是 
“科研 评价 ”。@@ 国际 科技 评价 改革 主要 是 指 欧洲 和 
北美 等 地 区 的 传统 科技 强国 主导 、 目 前 在 国际 上 形 
成 较 大 影响 的 科技 评价 改革 ， 包 括 改革 目标 、 改 革 
的 组 织 推动 过 程 、 改 革 的 基本 理念 及 开展 的 改革 实 
践 等 。 


1 国际 科技 评价 改革 要 解决 什么 问题 ? 


一 般 而 言 ， 欧 洲 和 北美 等 传统 科技 强国 因为 其 深 
厚 的 科学 文化 底蕴， 科学 价值 标准 与 追求 传统 上 是 不 
错 的 。 但 是 ， 随 着 科技 自身 的 发 展 及 其 地 位 的 提升 ， 
其 科技 评价 也 面临 新 的 问题 与 挑战 ， 必 须 与 时 俱 进 。 
归纳 起 来 ， 国 际 科技 评价 改革 要 应 对 的 问题 或 者 说 要 
达成 的 目标 大 致 有 3 个 方面 。 

(1) 避免 文献 计量 学 方法 在 科技 评价 中 的 不 当 使 
用 。 在 美国 学 者 Garfield" 提 出 利用 参考 文献 妃 踪 科学 
进展 的 引文 分 析 方法 后 ， 美 国 科学 信息 研究 所 (ISI) 
于 1963 年 开始 通过 引文 分 析 筛 选 期 刊 ， 形 成 科学 引文 
索引 (SCD 数据 库 ， 从 而 为 在 科研 评价 中 应 用 文献 
计量 学 方法 提供 了 基础 。 文 献计 量 学 方法 的 引入 , 一 


么 更 重要 ”， 这 无 疑 对 科研 产 出 的 质量 、 完 整 性 和 多 
样 性 产生 不 利 影响 。 如 何 避 免 文 献计 量 学 方法 的 不 当 
使 用 ， 成 为 国际 科学 共同 体面 临 的 重要 挑战 。 

(2) 重视 科学 对 经 济 社会 的 影响 力 (impact) 评 
价 。 随 着 科技 在 国家 经 济 社会 发 展 、 国 家 安全 等 方面 
地 位 的 提升 ， 科 技 竞争 愈演愈烈 ， 世 界 各 国 一 方面 加 
大 科技 投入 ， 男 一 方面 也 更 加 关注 科技 投入 对 本 国 创 
新 发 展 的 效率 和 效果 。 原 来 科学 投入 “只 问 耕 耘 ， 不 
问 收获 ”的 线 型 模型 被 质疑 ， 科 学 对 经 济 社会 的 影响 
力 评价 逐渐 成 为 科技 评价 的 核心 内 容 。 影 响 力 评价 的 
引入 带 来 2 个 方面 的 挑战 ，Q 科学 共同 体 难以 形成 共 
识 ， 很 多 科研 人 员 不 认可 影响 力 评价 ， 认 为 这 种 边界 
模糊 、 容 易 自我 吹 哮 的 评价 会 助长 学 术 不 端 、 损 害 学 
REE. O 准确 评价 影响 力 难度 太 大 ， 难 以 找到 科学 
的 指标 、 数 据 来 源 与 评价 方法 。 这 2 个 问题 也 是 国际 
科技 评价 界 讨论 的 热点 问题 。 

(3) 适应 开放 科学 、 基 于 人 工 智 能 的 科学 研究 等 
新 范式 发 展 。 以 数据 共享 为 基础 的 开放 科学 (open 
science) 外 近年 来 在 欧美 威 行 并 逐渐 影响 全 球 。 开 放 
科学 运动 兴起 的 同时 要 求 改革 科技 评价 系统 ， 以 提高 
公开 性 和 透明 度 。 但 是 ， 如 何 将 传统 上 以 个 人 创造 活 
动 为 主 的 科学 研究 ， 转 变 为 数据 共享 的 、 体 现 大 规模 
协作 的 集体 性 科研 活动 并 非 易 事 ， 需 要 各 方面 共同 努 
力 。 人 例如， 联合 国教 育 、 科 学 及 文化 组 织 
(UNESCO) 提出 了 关于 开放 科学 的 建议 所 ， 其 中 包括 
为 其 成 员 开 发 的 “开放 科学 工具 包 ”， 帮 助 他 们 审查 
和 改革 科研 职业 生涯 的 评估 标准 。 人 工 知 能 的 迅猛 发 
展 也 将 对 科技 评价 产生 深远 影响 , “人 工 智 能 驱动 的 
科学 研究 ”(AI for Science, (HERAS) 成 为 新 的 科 
学 范式 四 。 各 国都 致力 于 抢占 这 一 范式 制高点 ， 也 需 


方面 为 科技 评价 提供 了 证 据 支 撑 ; 另 一 方面 助 推 了 


要 通过 科技 评价 予以 激励 和 引导 。 同 时 ，AI4S 在 促进 


(D 笔者 担任 DORA 科技 评价 联盟 执 委 和 科技 管理 国际 联盟 科技 评价 工作 组 成 员 。 
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科技 发 展 、 减 轻 科 学 家 负担 的 同时 ， 可 能 强化 数据 预 
测 技 术 而 带 来 风险 与 偏见 ， 也 对 改革 科技 评价 提出 了 
新 挑战 。 不 过 ， 在 这 方面 目前 虽然 有 较 多 提 及 ， 但 目 
前 还 没有 成 为 10 年 来 国际 科技 评价 改革 的 重点 。 

就 以 上 3 个 方面 而 言 ， 这 次 国际 科技 评价 改革 要 
解决 的 紧迫 问题 或 者 说 核心 目标 是 前 2 个 方面 ， 即 文 
献计 量 学 方法 不 当 使 用 ， 以 及 影响 力 评价 。 这 与 我 国 
是 相似 的 ， 第 1 个 问题 即 文献 计量 学 方法 不 当 使 用 方 
面 的 挑战 在 我 国 尤其 严峻 。 这 是 因为 ， 相 比 于 传统 科 
技 强国 ， 由 于 科学 文化 薄弱 、 人 情 因素 过 多 等 原因 ， 
我 国 的 同行 评议 系统 还 不 够 健全 ， 这 导致 科技 评价 中 
对 论文 发 表 的 刊物 的 影响 因子 、 论 文 自身 的 引用 量 及 
论文 数量 等 量化 指标 更 加 倚重 。 第 2 个 问题 即 如 何 推 
动 影响 力 评价 跟 我 国正 在 推动 的 科技 成 果 “ 五 元 价 
值 ” 评 价 是 相似 的 。 但 是 ,我 国 破 “ 四 唯 ”®% 中 的 奖 
项 、 学 历 、 职 称 、 人 才 “ 帽 子 ”等 ， 更 多 是 我 国 特 
色 ， 对 于 一 些 传统 科学 强国 而 言 这 些 基 础 性 问题 并 不 
SE. 


2 国际 科技 评价 改革 采取 了 什么 举措 ? 


2.1 国际 科技 评价 改革 的 若干 重要 举措 

从 路 径 来 看 ， 国 际 科技 评价 改革 由 科学 共同 体 主 
导 ， 主 要 采用 自 下 而 上 方式 开展 。 国 际 科技 评价 改革 
启动 的 标志 性 事件 是 2013 年 5 月 《旧金山 宣言 》 的 发 
布 。 该 宣言 的 初稿 是 相关 学 者 和 编辑 在 2012 年 末 旧 金 
山 召 开 的 美国 细胞 生物 学 学 会 (ASCB) 年 会 期 间 ， 
针对 期 刊 影响 因子 在 科技 评价 中 不 当 使 用 的 兹 端 所 提 
出 的 。《 旧 金山 宣言 》 发 布 后 ， 许 多 国际 学 术 组 织 、 
学 术 年 会 、 高 校 与 研究 机 构 纷 纷 跟 进 ， 并 成 立 了 
DORA 科 技 评价 联盟 等 新 的 国际 组 织 共同 致力 于 推动 
科技 评价 改革 。2023 年 5 月 ,包括 中 国 在 内 的 全 球 许 
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多 国家 分 别 举行 了 《旧金山 宣言 》 发 布 10 周 年 纪念 
活动 ”。 

10 年 来 ， 国 际 科 学 共同 体 在 推动 科技 评价 改革 上 
做 了 大 量 形式 多 样 的 工作 ， 包 括 发 布 宣 言 、 倡 议 、 声 
明 ; 组 织 学 术 年 会 交流 、 专 题 研讨 、 项 目 研 究 ; 形成 
研究 专 报 、 科 技 评价 方法 框架 、 好 的 评价 案例 、 科 技 
评价 试点 协定 等 。 本 文 梳理 了 其 中 14 项 比较 重大 的 举 
措 ( 表 1)。 

2.2 国际 科技 评价 改革 的 主要 效果 

(1) 在 全 球 范围 内 形成 科技 评价 改革 共识 。 截 至 
2024 年 1 月 4 日 , 已 有 3 078 个 组 织 和 21 339 名 个 人 签 
署 了 《旧金山 宣言 》， 其 中 包括 来 自 中 国 的 15 家 机 构 。 
2022 年 , “推进 科研 评价 联盟 ”(CoARA) 正式 成 立 ， 
并 发 布 了 《改革 科研 评价 的 协定 》， 来 自 40 多 个 国家 
的 350 多 个 组 织 签署 了 协定 。 科 技 评价 改革 日 益 在 全 
球 范围 内 形成 共识 。 

(2) 经 过 科学 共同 体 各 方 力 量 共同 努力 ， 科 技 评 
价 改 革 的 “图 谱 ” 逐 渐 清晰 化 。 比 如 ,《 旧 金山 宣言 》 
提出 破除 “以 刊 评 文 ”; 《 莱 顿 宣言 》 进 一 步 提出 要 纠 
偏 “ 量 化 评价 "; 《量化 指标 潮流 》 报 告 进一步 明确 量 
化 评价 的 作用 及 规范 ; SCOPE 框架 定义 负责 任 评价 的 
过 程 等 。 不 同 的 学 术 组 织 针 对 不 同 问题 提出 科技 评 革 
的 不 同方 面 ， 拼 凌 成 一 个 比较 完整 的 “图 谱 ”"。 最 后 ， 
这 张 改革 “图 谱 ” 被 冠 以 “负责 任 科研 的 评价 ” 
(responsible research assessment). 的 标识 ， 逐 步 成 为 科 
技 界 的 共同 用 语 。 

(3) 科技 评价 改革 正在 从 理念 层面 走向 实践 。 目 
前 ,签署 《旧金山 宣言 》 的 3 000 个 多 组 织 正在 或 者 
已 经 落实 避免 “以 刊 评 文 ”要 求 。 签 署 《 改 革 科 研 评 
价 的 协定 》 的 300 多 个 组 织 (包括 资助 机 构 、 高 校 和 
科研 机 构 ) 正在 进行 科技 评价 改革 试点 ， 并 且 经 常 组 


(2) 以 后 破 " 四 唯 " 增 加 了 破 " 唯 帽 子 " ,发展 为 破 “ 五 唯 ”, 即 破 : 唯 论 文 、 唯 奖项 、 唯 学 历 、 唯 职称 、 唯 幅 子 。 
© 中 国 区 活动 由 中 国 科学 学 与 科技 政策 研究 会 科技 管理 与 评价 专 委 会 于 2023 年 5 月 19 日 举办 。 
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表 1 2013—2022 年 国际 科学 共同 体 推 动 科技 评价 改革 的 14 项 重大 举措 | 


Table 1 14 major measures to promote research assessment reform from 2013 to 2022 by international research community 


序号 年 份 ”举措 发 起 者 核心 内 容 
W3 针对 期 刊 影响 因子 的 使 用 ,提出 了 18 条 建议 ,包括 总 
1 0. 《科研 评价 的 旧金山 宣言 CDORA) DORA 科 技 评价 联盟 ” 体 建议 和 针对 资助 机 构 、 研 究 机 构 、 出 版 机 构 等 不 同 
i 主体 的 建议 
2015 EES : : a 莱 顿 大 学 科学 技术 研 gil IE E cS H5 4o. m 
2 œ 《 莱 顿 宣言 )(Leiden Menifeso) 究 中 心 (CWTS) 提出 了 规范 使 用 定量 指标 的 十 大 原则 
2010 impie zs č 英格兰 高 等 教育 基金 ”对 定量 指标 在 英国 卓越 研究 框架 (REF) 中 的 使 用 进 
d doc 委员 会 (HEFCE)  — 行 评估 与 反思 ,提出 建议 
Sui cEGT ni Bu HEBIeL. 学 科 
2016 《人 文科 学 定量 指标 的 15 个 关键 原则 》 HuMetricsHSS imp p M mU 
^ 年 (15 Key HuMetricsHSS Principles)! 工作 组 和 
古 ,促进 对 学 术 界 价值 观 制定 方法 的 培养 
t 3LER- EE Ep] 立 将 专家 评议 E Oik 
《下 一 代 指标 :负责 任 的 开放 科学 指标 和 评估 》 Enn ME Orc NET 
P ( Next-generation metrics: responsible metrics 欧盟 委员 会 Ea ih cede e ed 
年 "m Š “真正 重要 ”的 内 容 ,使 评估 指标 具备 开放 性 、 互 操 
and evaluation for open science)?! "M 
调 了 科技 评估 模型 指标 电 放 科学 实践 中 的 重 
6 707 《转型 中 的 科学 ) 报 告 (Science in Tanstion)"! MEZRA 2 
2019 科技 管理 国际 联盟 科 ”提出 了 负责 任 评估 的 5 个 步骤 :评估 价值 观 (start)、 
7 “和 ”负责 任 评估 的 SCOPE 框 架 "” 技 评价 工作 组 情景 考虑 (context)、 评 估 选 项 (options)、 深 入 调研 
Ü (INORMS-REW) (probe). 75 Efe (evaluation) 
《向 开放 科学 过 渡 的 研究 评估 路 线 图 》 — P 
寺 成 员 EB os ES UE ml 负责 任 
8 song (Roadmap on Research Assessment in the 欧洲 大 学 联盟 \EUA) e ee edm 人 
£E m R 49 评价 方法 
Transition to Open Science)nal 
XD ape n AU RIED au 处 于 职业 生涯 早期 的 年 轻 科研 人 员 共同 提出 了 关于 
9 ` (Scientific Excellence, Publishing models, (GYAWG) 卓 越 科 学 E e S aD cce 
年 改进 科研 评估 过 程 的 15 项 建议 
assessment and open science) ^l 工作 组 
2018 《同行 /价值 评议 原则 声明 》 全 球 研 究 理事 会 
是 出 了 负责 任 平 审 的 原 贝 
19 g (Statement of Principles on Peer/Merit Review)" (GRC) 是 出 了 负责 任 专家 评审 的 原则 
3j 员 评价 的 香港 原 贝 < 届 科 研 诚信 国际 E E E : = 
E 第 人 “ 届 科 研 诚信 力 际 “提出 将 学 术 诚信 作为 科研 人 员 考核 评价 的 重要 标准 
£F Principles for Assessing Researchers) A 
JERMAK FAAA TE B E " E 
apo Ur CE CUIDA AUI HR 科学 欧洲 (Science — 基于 《旧金山 宣言 3 和 《 莱 顿 宣言 ) 提 出 了 若干 补充 性 
12 ^ ,. (Science Europe Position Statement on Research ni 
年 人 Europe) 建议 
Assessment Processes)!” 
2020 《负责 任 科研 评估 会 议 总 结 报告 》 全 球 研究 理事 会 T. MN D ETRE 
iq (BRA Comernco mn (GRC) 在 全 球 研究 资助 机 构 内 形成 负责 任 评估 的 共识 
《改革 科研 评价 的 协定 》 Cazim 提出 承认 科学 工作 的 多 样 性 \ 承 诺 科 研 评价 的 合理 
14 °S? (The Agreement on Reforming Research COURSE w pak” EMRE A OA 


Assessment)" 诺 及 6 项 支持 性 承诺 


注 : 表 1 整理 过 程 中 参考 了 文献 [20] 
Noted: Table 1 was compiled with reference to Ref. [20] 


织 各 种 形式 的 试点 经 验 交 流 。 之 间 的 关系 ， 启 动 评价 的 前 提 条 件 ， 以 及 提升 评价 数 
(4) 形成 了 关于 科技 评价 的 一 些 基 本 判断 。 包 括 ”” 据 质量 的 技术 等 。 这 些 理性 认识 对 我 国有 重要 启示 
对 科技 评价 正 、 反 两 方面 作用 ， 定 量 评价 与 定性 评价 意义。 
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3 国际 上 的 “三 评 ” 改 革 实 践 案例 


如 前 文 所 述 ， 国 际 科技 评价 改革 正在 从 理念 层面 
走向 实践 ， 以 下 进行 实践 案例 分 析 。 鉴 于 我 国 当 前 科 
技 评价 源 于 国家 “三 评 ” 改 革 文 件 ， 在 此 也 分 别 选择 
人 才 评 价 、 项 目 评审 和 机 构 评估 3 个 方面 的 案例 进行 
分 析 。 

3.1 比利时 根 特大 学 人 才 评 价 改革 

比利时 根 特 大 学 (Ghent University). 较 早 注意 到 
基于 文献 计量 学 方法 的 定量 评价 对 研究 文化 带 来 的 系 
统 性 损害 ， 认 为 定量 评价 助长 了 “发 表 在 哪儿 比 发 表 
什么 更 重要 ”的 文化 。2013 年 发 布 后 ， 根 特大 学 签署 
了 《旧金山 宣言 》。 之 后 ， 又 签署 了 《改革 科研 评价 
的 协定 》。 随 之 着 手 对 科教 人 员 晋 升 评价 等 人 才 评 价 
进行 改革 ， 以 维护 根 特大 学 一 贯 倡导 的 多 元 化 文化 ， 
同时 消除 教师 对 量化 评价 越 来 越 大 的 不 满 ， 力 图 创建 
一 个 强调 追求 卓越 研究 的 共同 价值 观 、 富 有 挑战 性 、 
高 质量 日 具 激 励 性 的 职业 框架 。 

在 学 校 管理 层 和 科教 人 员 的 共同 努力 下 ，2016 年 
11 月 ， 根 特大 学 发 布 了 《 根 特 大 学 评价 研究 愿景 声 
明 》R9， 提 出 科研 评价 必须 遵守 8 项 原则 。2017 年 进 
一 步 公 布 了 科研 评价 中 定量 指标 的 使 用 指南 中 。 根 据 


国际 科技 评价 改革 十 年 评述 


相关 领域 的 发 展 。NIH 在 签署 了 《旧金山 宣言 》 后 ， 
着 手 进行 项 目 评 审改 革 ， 以 消除 已 有 评审 中 存在 的 量 
化 问题 与 偏见 ， 同 时 适应 开放 科学 的 发 展 。 改 革 主 要 
包括 3 个 方面 。 

(1) 修改 评审 规则 四。 新 规则 要 求 对 于 研究 者 和 
研究 环境 的 评估 必须 放 在 研究 项 目的 背景 下 来 考虑 而 
不 是 像 之 前 被 单独 评分 。 无 论 是 人 员 还 是 机 构 ， 评 审 
标准 不 再 是 “ 越 强 越 好 ”而 是 “能 胜任 即 可 ”; 如 果 
评审 专家 认为 人 员 或 机 构 能 力 不 足 ， 则 需要 给 出 具体 
说 明 。 新 标准 的 “ 够 用 ”原则 试图 尽量 解决 声望 偏 
见 ， 将 关注 点 更 多 地 放 在 研究 课题 本 身上 面 而 非 机 构 


n 


1% 


声誉 。 
(2) 修改 项 目 申 请 所 用 的 简历 格式 或 “专家 介 
绍 ” 外 。 在 专家 介绍 中 添加 小 段 篇 幅 ， 由 申请 人 简要 
描述 其 最 重要 的 科学 成 就 ， 以 转移 项 目 评 审 专家 对 以 
往 人 研究 论文 发 表 期 刊 的 关注 度 。 

(3) 出 台数 据 管理 和 共享 新 政策 。 自 2023 年 1 月 
起 ， 要 求 每 年 受 NIH 资助 的 30 万 名 研究 人 员 和 2 500 
个 机 构 中 的 大 多 数 在 其 拨款 申请 中 痢 明 数据 管理 和 共 
Æ (DMS) 计划 外。DMS 计 划 中 应 包括 分 析 数 据 所 需 
的 软件 或 工具 的 细节 、 何 时 何 地 公布 原始 数据 ， 以 及 
访问 或 分 发 该 数据 的 任何 特殊 考虑 ， 并 对 数据 共享 的 


这 2 项 政策 ，2018 年 根 特大 学 建立 了 一 种 全 新 的 教师 
评价 和 晋升 模式 ， 重 新 将 “责任 ”和 学 术 自 由 还 给 教 
授 级 教职员 。 根 据 新 的 评价 体系 ， 根 特大 学 对 教师 的 
评价 不 再 只 看 科研 产 出 ， 而 会 从 更 加 和 定性、 综合 且 以 
人 为 本 的 视角 进行 评价 。 评 价 以 5 年 为 周期 ， 包 括 初 
期 的 证 据 性 评价 、 中 期 反馈 访谈 和 末期 的 访谈 式 评 
价 。 评 价 内 容 包括 在 研究 、 教 学 、 社 会 参与 度 、 管 理 
和 和 领导 力 方面 最 重要 成 就 的 叙述 性 展示 《而 非 使 用 可 
衡量 的 定量 标准 )， 以 及 未 来 5 年 的 意向 规划 。 
3.2 美国 国立 卫生 研究 院 (NIH) 项 目 评审 改革 
美国 国立 卫生 研究 院 (NIH) 是 美国 最 主要 的 医 
学 研究 和 资助 机 构 ， 每 年 都 会 资助 大 量 新 项 目 以 推动 


任何 限制 或 例外 情况 说 明理 由 ， 以 促进 开放 科学 
发 展 。 
3.3 英国 大 学 评价 改革 

2014 年， 英国 对 原 有 大 学 科研 评 佑 考核 (RAE) 
体系 进行 较 大 幅度 改革 ， 形 成 新 的 科研 卓越 框架 
(REF)。 相 较 于 以 往 的 评估 体系 RAE，REF 最 大 的 改 
革 亮 点 在 于 : @ 引入 了 文献 计量 学 评价 指标 ， 为 同行 
评议 提供 参考 ;人 @) 探索 了 影响 力 评价 方法 中 ， 以 展示 
英国 大 学 研究 对 社会 的 真正 影响 ， 强 调 科 学 研究 给 现 
实 世 界 带 来 的 利益 。 由 于 影响 力 评价 难度 较 大 ， 英 国 
为 此 进行 专门 研究 ， 开 发 了 针对 不 同类 型 学 科 科 研 成 
果 的 影响 力 指标 。 
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2014 实 施 的 REF (REF 2014) ， 在 实现 以 评估 结 
果 对 大 学 进行 资源 配置 的 同时 ， 也 不 可 避免 地 将 竞争 
压力 通过 大 学 传导 至 基层 学 术 组 织 ， 
的 引入 加 剧 了 对 教师 个 人 科研 行为 的 影响 。2015 年 ， 
受 英国 高 等 教育 基金 委员 会 委托 V James Wilsdon 教 
授 为 首 的 研究 组 对 定量 指标 在 REF 中 的 作用 进行 了 独 
立 评估 。 为 此 ， 研 究 组 启动 了 负责 任 评价 指标 专题 论 
坛 ， 重 点 关注 与 讨论 在 科技 评价 中 如 何 用 好 定量 指标 
的 问题 。 最 后 ， 研 究 组 发 布 了 题 为 《量化 指标 潮流 》 
的 研究 报告 ， 对 使 用 定量 指标 给 出 了 肯定 判断 并 提出 
改进 建议 。 

2022 年 ， 英 国 REF 的 领导 机 构 一 一 英格兰 研究 院 
(Research England) 签署 了 《改革 科研 评价 的 协定 》， 
要 对 REF 继续 进行 改革 ， 旨 在 整个 高 校 科 研 生态 系统 
重新 建立 起 一 种 负责 任 、 包 容 、 多 样 的 科研 文化 。 由 
此 ， 英 国 启 动 了 “未 来 科研 评价 计划 ”中 ， 叶 在 对 刚 
实施 完毕 不 久 的 REF 2021 未 来 变革 方案 进行 更 深入 研 
究 。 根 据 2023 年 6 月 发 布 的 新 一 轮 顶 层 设计 方案 ， 
REF 2028 的 政策 重心 将 从 “科研 绩效 激励 ”调整 为 
“科研 文化 建设 ”， 并 且 全 面 重 塑 科研 环境 、 科 研 成 果 
和 科研 影响 3 个 评价 维度 ， 以 提升 高 校对 建设 健康 科 
研 文化 的 重视 程度 。 

3.4 国际 上 “三 评 ” 改 革 实 践 的 主要 经 验 

(1) 理论 与 实践 结合 。 试 点 机 构 充 分 利用 科技 评 
价 10 年 改革 期 间 国际 科学 共同 体 构建 的 一 系列 理论 和 
方法 体系 指导 实践 ， 理 论 与 实践 紧密 结合 。 

(2) 保持 与 其 他 试点 机 构 的 交流 共享 。 试 点 机 构 
一 般 会 签署 《旧金山 宣言 》 和 《改革 科研 评价 的 协 
定 》， 置 身 于 试点 集体 之 中 ， 与 科技 评价 研究 的 学 者 
以 及 其 他 试点 机 构 保 持 互 动 交流 。 

(3) 在 评价 方法 上 保持 不 断 创 新 和 完善 ， 而 不 奢 
望 一 践 而 就 。 例 如 ，REF 自 2008 年 提出 引入 科研 影响 
力 评价 ， 期 间 花 费 了 大 量 的 人 力 和 时 间 研 究 开发 影响 
力 的 内 涵 、 评 价 标准 、 评 价 方法 、 专 家 手册 等 ， 直 至 


地 别 是 定量 指标 
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2014 年 才 应 用 于 实际 评价 之 中 ， 而 且 现在 依然 在 研究 
和 完善 之 中 。 

(4) 试点 机 构 体 现 了 充分 的 改革 自主 性 。 各 机 构 
响应 国际 科学 共同 体 的 倡议 启动 改革 ， 是 出 于 自身 在 
理念 上 的 认同 和 实际 需求 ， 完 全 是 自主 的 ， 而 不 是 源 
自 政府 行政 要 求 。 


4 结论 与 启示 


4.1 结论 

国际 科技 评价 10 年 改革 值得 总 结 的 内 容 很 多 ， 本 
文 主要 从 与 我 国 科技 评价 改革 比较 角度 ， 得 出 3 个 方 
面 结论 。 

(1) 国际 科技 评价 改革 目标 与 我 国 相似 。 本 次 国 
际 科技 评价 改革 的 核心 目标 有 2 个 : 0 破 “ 以 刊 评 
Xx", ， 这 与 我 国 破 “四 唯 ” 之 中 破 “ 唯 论文 ”的 导向 
是 一 致 的 ; O 立 对 经 济 和 社会 贡献 的 “影响 力 ” 评 
价 ， 这 与 我 国 强调 科技 成 果 的 五 元 价值 中 是 一 致 的 。 
但 是 ,我国 破 “四 唯 ” 中 破 奖项 、 学 历 、 职 称 、 人 才 
“帽子 ”等 ， 主 要 是 我 国 特色 。 对 于 国际 上 的 传统 科 
学 强国 而 言 ， 科 技 奖项 、 人 才 “ 帽 子 ” 等 基础 性 评价 
问题 并 不 明显 。 

(2) 国际 科技 评价 改革 路 径 与 我 国 差异 较 大 。 国 
际 科技 评价 改革 主要 由 科学 共同 体 主导 ， 采 用 自 下 而 
上 的 方法 ， 通 过 科学 共同 体 发 布 宣言 、 倡 议 、 评 价 方 
法 体系 、 签 署 承 诺 协议 、 实 践 案 例 总 结 与 分 享 等 方式 
推动 ， 政 府 很 少 直 接 介入 。 相 反 ， 我 国 更 多 采用 自 上 
而 下 方法 ,政府 在 科技 评价 改革 中 发 挥 主导 作用 ， 通 
过 发 布 改 革 的 政策 文件 和 要 求 推动 改革 ， 科 学 共同 体 
的 作用 发 挥 有 限 。 

(3) 国际 科技 评价 10 年 改革 经 验 值得 借鉴 。 与 自 
上 而 下 的 我 国 科 技 评 价 改革 执行 力 强 的 特点 不 同 ， 国 
际 科技 评价 改革 更 加 关注 对 科技 评价 规律 的 认识 。 由 
此 ， 国 际 科 技 评价 改革 达成 了 比较 系统 的 共识 ， 值 得 
借鉴 。 当 然 ， 国 际 科 技 评价 改革 所 形成 的 许多 共识 跟 


我 国 在 实践 中 秉持 的 理念 是 相似 的 ， 有 些 甚至 有 异 曲 
同 工 之 妙 。 国 际 科技 评价 改革 的 共识 包括 :《 旧 金山 
宣言 》 提 出 的 关注 论文 本 身 而 不 是 期 刊 的 倡议 及 对 不 
同 主体 做 法 上 的 建议 、《 莱 顿 宣言 》 提 出 的 关于 合理 
使 用 定量 评价 的 倡议 、INORMS 科技 评价 工作 组 提出 
的 SCOPE 方 法 ， 以 及 英国 REF 评估 形成 的 影响 力 评价 
方法 等 。 其 中 部 分 核心 观点 值得 特别 提 及 : O 科技 评 
价 是 管理 的 需要 ， 也 是 一 把 “ 双 刃 剑 "， 没 有 充足 理 
由 和 充分 准备 不 要 轻易 启动 科技 评价 。@) 科技 评价 离 
不 开 同 行 评议 ， 难 以 通过 简单 量化 方法 评价 。 但 是 ， 
量化 方法 如 果 使 用 得 当 ， 能 够 有 效 提 升 同 行 评议 质 
Eo O 量化 方法 有 好 坏 之 分 ， 在 实际 评价 中 需要 辨别 
与 选择 好 的 量化 方法 ， 如 学 科 规 范 化 引文 影响 力 
(CNCI) 指标 外， 避免 使 用 不 好 的 量化 方法 ， 如 期 刊 
影响 因子 。 由 需要 关注 支撑 定量 评价 的 数据 质量 及 其 
来 源 的 可 靠 性 ， 没 有 数据 质量 及 其 来 源 可 靠 性 保障 ， 
光 是 指标 好 看 没有 用 。@ 通过 使 用 唯一 标识 符 (如 
ORCID) ， 将 科研 产 出 、 参 与 的 科研 活动 等 与 科研 人 
员 绑 定 ， 在 保证 定量 评价 数据 质量 的 基础 上 方便 查寻 
获取 ， 已 经 成 为 国际 科学 共同 体 越 来 越 普 遍 的 做 法 。 
4.2 启示 

以 上 通过 中 外 比较 得 出 的 结论 ， 对 我 国 科技 评价 
改革 有 许多 启示 ， 本 文 重点 论述 4 个 方面 的 启示 。 

(1) 分 类 分 步 破 “ 唯 "。 评 价 改革 要 明确 责任 主体 
和 先后 次 序 。 目 前 我 国 的 “四 唯 ”中 ,，“ 唯 ”要 分 类 
分 步 而 破 。Q@ 严重 性 不 同 。“ 唯 论文 ”“ 唯 奖项 ”“ 唯 
帽子 ”比较 严重 需要 重点 关注 ,“ 唯 学 历 ” 和 “ 唯 职 
称 ” 也 是 问题 但 影响 面 较 小 。@ 责任 主体 不 同 。“ 唯 
论文 ”的 责任 主体 主要 在 科学 共同 体 ， 这 和 国际 科技 
评价 改革 一 致 ;“ 唯 奖项 *”“ 了 唯 帽子 ”责任 主体 主要 在 
政府 ， 国 际 科技 评价 改革 没有 这 方面 的 问题 。 这 2 个 
责任 主体 的 问题 是 交互 作用 的 ,但 是 ， 有 先后 次 序 。 
“ 唯 奖 项 ”“ 唯 帽子 ”本 质 是 奖项 和 “帽子 ”过 多 , 需 
要 政府 做 减法 ， 为 科学 共同 体 破 “ 唯 论文 ” 安心 产 
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出 原创 成 果 提 供 基 础 性 管理 制度 保障 。“ 唯 论文 ” 则 
需要 借鉴 国际 科技 评价 改革 经 验 ， 更 好 地 发 挥 科学 共 
同体 自 下 而 上 改革 的 主动 性 ， 形 成 先行 先 试 、 敢 为 天 
下 先 的 局 面 。 

(2) 慎重 启动 评价 。 评 价 是 一 把 “ 双 刃 剑 "， 国 际 
科技 评价 改革 提倡 不 要 轻易 启动 科技 评价 ， 这 与 我 国 
科技 评价 改革 节奏 有 相通 之 处 。 事 实 上 ， 在 破 “ 唯 ” 
之 前 ， 我 国 首 先 开 展 的 是 “ 减 量 ”改革 ， 要 求 各 单位 
清理 过 多 过 频 、 重 复 交 叉 的 评价 。 但 是 ， 近 年 来 减 量 
风头 过 去 后 ， 评 价 冲 动 又 有 释放 苗头 ; 加 上 国家 新 出 
台 的 “全 面 实施 预算 绩效 管理 ”的 要 求 在 落实 中 还 没 
有 和 原 有 科技 评价 协调 好 ， 评 价 频次 又 多 起 来 了 。 对 
此 ， 需 要 通过 建立 对 评价 进行 评价 的 机 制约 束 评价 冲 
动 、 规 范 评 价 制度 和 方法 ， 而 不 仅仅 停留 于 开展 减 量 
改革 的 阶段 性 运动 。 

(3) 用 好 量化 评价 。 作 为 同行 评议 的 辅助 方法 ， 
量化 评价 在 本 次 国际 科技 评价 改革 中 得 到 了 重点 关 
注 ， 形 成 了 较 多 共识 。 鉴 于 我 国 过 去 量化 评价 过 于 极 
端 ， 在 这 次 破 “四 唯 ” 改 革 中 ， 有 一 派 观 点 主张 完全 
放弃 定量 评价 ， 回 归 同 行 评议 。 结 合 我 国 国情 ， 这 是 
不 可 取 的 。 笔 者 曾经 提出 定量 、 定 性 相 结合 的 
BRIDGE 理论 中 ， 主 张 通过 表单 化 方法 将 数据 材料 和 
证 据 的 隐 性 知识 显 性 化 ， 从 而 对 同行 评议 起 到 支撑 和 
约束 作用 。 这 一 方面 是 将 我 国 已 有 量化 评价 探索 做 到 
物 尽 其 用 ， 男 一 方面 可 能 在 定量 定性 结合 的 评价 方法 
上 形成 改革 突破 ,并 为 国际 科技 评价 改革 作出 中 国 
贡献 。 

(4) 积极 融入 国际 科技 评价 改革 。 目 前 ， 我 国 签 
署 《旧金山 宣言 》 的 科研 机 构 、 高 校 和 科学 家 个 人 还 
比较 少 ， 与 我 国 庞大 的 科学 共 体 还 不 相称 。 同 时 ,我 
国 还 没有 科研 机 构 和 高 校 加 入 国际 《改革 科研 评价 的 
协定 》 之 中 。 这 种 情况 与 我 国 作为 后 发 国家 还 存在 一 
个 逐步 融入 国际 科学 共同 体 的 过 程 有 关 ， 也 与 我 国 科 
技 评价 改革 由 政府 主导 的 特点 有 关 ， 甚 至 近 几 年 的 疫 
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情 也 有 较 大 影响 。 作 为 国际 科学 共同 体 的 一 部 分 ， 我 
国 应 该 更 加 积极 地 融入 国际 科技 评价 改革 。 通 过 与 国 
际 科学 共同 体 相互 借 鉴 和 促进 ， 一 方面 可 以 更 好 地 激 
发 我 国 科学 共同 体 在 科技 评价 改革 上 的 主动 性 ， 另 一 
方面 可 以 增加 科学 共同 体 之 间 的 理解 与 信任 ， 从 而 有 
利于 加 强 全 方位 国际 科技 合作 的 纽带 。 


=; 
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Review on reform of international research evaluation in past decade 
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Abstract In May 2013, with the release of the San Francisco Declaration on Research Assessment (DORA) as a symbol, the reform 
of international research evaluation began. Over the past decade, the reform of international research evaluation has undergone 
extensive theoretical preparation and initiatives, and is now moving towards practice. More than 350 institutions from over 40 
countries have signed agreements to reform research evaluation and carried out pilot reforms, with initial results. This study 
systematically summarizes and analyzes the ten-year reform of international research evaluation in three aspects: reform goals, 
measures, and cases. From the perspective of comparing with China's research evaluation reform, research conclusions and 
inspirations are drawn. 
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